mysql执行计划

2018-04-24

实际项目开发中，由于我们不知道实际查询的时候数据库里发生了什么事情，
数据库软件是怎样扫描表、怎样使用索引的，因此，在写sql语句的时候就
很少考虑到性能的问题。但是当数据规模增大，如千万、亿的时候，我们运

行同样的sql语句时却发现迟迟没有结果，这个时候才知道数据规模已经限
制了我们查询的速度。所以，查询优化和索引也就显得很重要了。

MySql提供了EXPLAIN语法用来进行查询分析，在SQL语句前加一个”EXPLAIN”
即可。
如：explain select * from table where table.id = 1

id : id列数字越大越先执行，如果说数字一样大，那么就从上往下依次执行

(select_type看不懂的，可以了解一下即可)
select_type列常见的有：
A：simple：表示不需要union操作或者不包含子查询的简单select查询。
有连接查询时，外层的查询为simple，且只有一个。
B：primary：一个需要union操作或者含有子查询的select，位于最外层的
单位查询的select_type即为primary。且只有一个。
C：union：union连接的两个select查询，第一个查询是dervied派生表，除
了第一个表外，第二个以后的表select_type都是union。
D：dependent union：与union一样，出现在union 或union all语句中，但
是这个查询要受到外部查询的影响。
E：union result：包含union的结果集，在union和union all语句中,因为它
不需要参与查询，所以id字段为null。
F：subquery：除了from字句中包含的子查询外，其他地方出现的子查询都可
能是subquery。
G：dependent subquery：与dependent union类似，表示这个subquery的查询
要受到外部表查询的影响。
H：derived：from字句中出现的子查询，也叫做派生表，其他数据库中可能叫
做内联视图或嵌套select。

table ：显示这一行的数据是关于哪张表的。

type ：显示连接使用了何种类型。从最好到最差的连接类型为const、
eq_ref、ref、range、index和ALL。

const：表示通过索引一次就找到了。

eq_ref：联表操作，外表的一条元组，内表只有唯一一条元组与之对应。

ref：联表操作，外表的一条元组，内表可有若干条元组与之对应。

range：表示这个连接类型使用索引返回一个范围中的行，比如使
用BETWEEN，IN，>=，LIKE等查找东西时发生的情况。

index：索引全表扫描，把索引从头到尾扫一遍。

all：表示为全表扫描；

possible_keys：查询可能使用到的索引都会在这里列出来

key :显示MySQL实际决定使用的键。如果没有索引被选择，键是NULL。
key=primary的话，表示使用了主键；
key=null表示没用到索引。

key_len:显示MySQL决定使用的键长度，表示索引中使用的字节数。

ref ：如果是使用的常数等值查询，这里会显示const；如果是连
接查询，被驱动表的执行计划这里会显示驱动表的关联字段；如
果是条件使用了表达式或者函数，或者条件列发生了内部隐式转
换，这里可能显示为func。

rows：这里是执行计划中估算的扫描行数，不是精确值

extra：关于MYSQL如何解析查询的额外信息。
这里可以看到的坏的例子是Using temporary和Using filesort，
意思MYSQL根本不能使用索引，结果是检索会很慢。

这个列可以显示的信息非常多，有几十种，常用的有
A：distinct：在select部分使用了distinc关键字

B：no tables used：不带from字句的查询或者From dual查询

C：使用not in()形式子查询或not exists运算符的连接查询，
这种叫做反连接。即，一般连接查询是先查询内表，再查询外
表，反连接就是先查询外表，再查询内表。

D：using filesort：排序时无法使用到索引时，就会出现这个。
常见于order by和group by语句中

E：using index：查询时不需要回表查询，直接通过索引就可以
获取查询的数据。

F：using join buffer（block nested loop），using join buffer
（batched key accss）：5.6.x之后的版本优化关联查询的BNL，BKA
特性。主要是减少内表的循环数量以及比较顺序地扫描查询。

G：using sort_union，using_union，using intersect，
using sort_intersection：
using intersect：表示使用and的各个索引的条件时，该信息表示是
从处理结果获取交集
using union：表示使用or连接各个使用索引的条件时，该信息表示从
处理结果获取并集
using sort_union和using sort_intersection：与前面两个对应的类
似，只是他们是出现在用and和or查询信息量大时，先查询主键，然后
进行排序合并后，才能读取记录并返回。

H：using temporary：表示使用了临时表存储中间结果。临时表可以是
内存临时表和磁盘临时表，执行计划中看不出来，需要查看status变量，
used_tmp_table，used_tmp_disk_table才能看出来。

I：using where：表示存储引擎返回的记录并不是所有的都满足查询条
件，需要在server层进行过滤。查询条件中分为限制条件和检查条件，
5.6之前，存储引擎只能根据限制条件扫描数据并返回，然后server层根
据检查条件进行过滤再返回真正符合查询的数据。5.6.x之后支持ICP特
性，可以把检查条件也下推到存储引擎层，不符合检查条件和限制条件
的数据，直接不读取，这样就大大减少了存储引擎扫描的记录数量。
extra列显示using index condition

J：firstmatch(tb_name)：5.6.x开始引入的优化子查询的新特性之一，
常见于where字句含有in()类型的子查询。如果内表的数据量比较大，
就可能出现这个

K：loosescan(m..n)：5.6.x之后引入的优化子查询的新特性之一，在in()
类型的子查询中，子查询返回的可能有重复记录时，就可能出现这个

除了这些之外，还有很多查询数据字典库，执行计划过程中就发现不可
能存在结果的一些提示信息

11）filtered
使用explain extended时会出现这个列，5.7之后的版本默认就有这个
字段，不需要使用explain extended了。这个字段表示存储引擎返回的
数据在server层过滤后，剩下多少满足查询的记录数量的比例，注意是
百分比，不是具体记录数。